Confiado, Calibrado o Cómplice: Alineación de Seguridad y Sesgo Ideológico en la Detección de Discurso de Odio por LLM
Explora cómo los LLMs detectan el discurso de odio: entre confianza, calibración y complicidad. Un análisis crítico sobre seguridad y sesgo en la moderación.